Corpus for Benchmarking Clinical Speech De-identification
Este artículo presenta el corpus SREDH-AICup, un conjunto de datos de voz clínica alineado temporalmente y anotado con información sensible de salud en inglés y mandarín, diseñado para abordar la escasez de recursos públicos y facilitar la investigación en desidentificación de voz médica multilingüe.